#Nano Banana Pro上
Nano Banana Pro 不會用?超詳細的Google官方教學來了
自從 Nano Banana Pro 發佈以來,感覺全網的 AI 玩家都在用它“整活”。我也和大家一樣,在網上看了各種教學,各種複製貼上提示詞。但試多了你會發現,這些非官方的攻略往往“知其然不知其所以然”,要麼太片面,要麼換個場景就失效了。這種“抽盲盒”的感覺太難受了。幸好,Google 發佈了一份官方指南,算是比較系統的進行了介紹。圖:Google官方發佈的 NBP 指南我把每一個功能都重新測試、驗證了一遍。並把(幾乎)所有的案例都重寫了,以更適合中國寶寶體質。這篇文章,就是我花了整整一晚上時間整理出來的“乾貨結晶”,希望能幫你把那些碎片化的知識,一次性串起來。01|那怕是一份財報,它也能做成藝術品以前做資訊圖表,那是設計師的噩夢。現在?只要你把一堆複雜的文字扔給 NBP,它能分分鐘給你整理得明明白白。直接看幾個例子。復古風格資訊圖表:我讓它把“港式茶餐廳歷史”做成圖,還要帶點 1980 年代的味道。提示詞:一張1980年代復古風格的資訊圖,主題是關於港式茶餐廳的歷史。請包含‘經典美食’、‘懷舊地磚’和‘霓虹招牌’三個獨立類股。確保所有文字清晰可讀,並使用符合那個年代審美的字型設計。財報秒變海報:打工人的周報救星來了。不用再畫 Excel,直接生成這種現代風圖表,老闆看了都得愣一下。提示詞:用中文生成一張乾淨、現代的資訊圖表,總結這份財報中的關鍵財務亮點。包含‘營收增長 ’和‘淨利潤’的圖表,並用風格化的引語框高亮顯示 CEO 的關鍵語錄。不要引用標籤,使用Google配色技術圖紙:如果你是搞工程或者建築設計的,以前畫這種正投影藍圖得在 CAD 裡啃半天。現在 NBP 能直接生成這種專業感拉滿的圖。提示詞:建立一個正投影藍圖 (orthographic blueprint),通過平面圖、立面圖和剖面圖來描述這座建築。用技術建築字型清晰標註‘北立面 (North Elevation)’和‘主入口 (Main Entrance)’。格式為 16:9。甚至是……手繪白板那怕是複雜的“移動支付原理”,它也能模仿大學教授在白板上畫的草圖,連馬克筆的筆觸都還原了。提示詞:見附件將‘中國移動支付生態系統運作原理’(如支付寶或微信支付)的概念總結成一張適合大學課堂講座的手繪白板示意圖。請使用不同顏色的馬克筆來區分‘使用者/商戶前端’和‘銀行/清算後台’類股,并包含清晰可讀的‘掃碼互動’和‘加密結算’標籤。對於這一類的圖,Google給的秘訣就三點:資訊濃縮: 別管是長文章還是 PDF,扔給它,告訴它“提煉重點”。風格設定: 想要“雜誌風”、“技術藍圖”還是“手繪白板”?一定要說清楚。指定內容: 比如財報,你只關心“賺了多少”,就命令它只畫利潤部分。02|終於!人物不再“換臉”了玩 AI 繪圖最大的痛點是什麼?人物一致性。上一張圖還是瓜子臉,下一張圖就變成了國字臉,根本沒法做連貫的故事。NBP 這次真的進化了。它支援最多 14 張參考圖!這就像是你把演員的定妝照直接拍在 AI 臉上,告訴它:“就這個人,鎖死,別動。”比如,我要給這個人物做一個爆款視訊封面:提示詞:見附件[上傳一張圖片]使用圖1中的人物設計一個爆款視訊封面面。部一致性:保持人物面部特徵與圖1完全一致,但將表情改為極其震驚和難以置信,張大嘴巴。動作:將人物安排在畫面右側,雙手抱頭,目光看向畫面左側。主題:在畫面左側,放置一台最新款國產旗艦手機的高畫質特寫圖像,螢幕亮起顯示跑分畫面。圖形元素:在手機周圍加入爆炸放射狀的效果線,並用一個巨大的紅色箭頭指向手機螢幕。文字:在畫面中央疊加巨大的、綜藝花字風格的文字:‘這性能逆天了?!’。使用粗大的白色描邊和強烈的黑色投影。背景:一個模糊的、充滿霓虹燈帶的電競房背景。高飽和度和高對比度。大家可以猜猜這個封面人物是誰?我感覺人物形象維持的挺好的。不只是人物,你可以拿一個 Logo 來設計一堆物料,而且保持這個 Logo在所有的地方都是一致的。這裡拿我的 Logo 來舉例。提示詞:[上傳logo 圖片]用這個 logo ,為一家名為“AI 范兒”的書店建立多種不同類型的品牌物料。NBP 還可以保持多個對象的一致性,最多到 5 個。這種群體的一致性保持,在做故事片的時候沒有還真不行。提示詞:[輸入 3 張不同毛絨生物的圖像] “創作一個包含 10 個部分的有趣故事,講述這 3 個毛絨夥伴去熱帶度假的經歷。故事全程驚險刺激,情感起伏跌宕,最後以幸福時刻結尾。保持所有 3 個角色的服裝和身份一致,但它們在所有 10 張圖片中的表情和角度應有所變化。確保每張圖片中每個角色只出現一次。03|它是聯網的!這一招很多人不知道。記得在提示詞裡加上一句 “結合 Google 搜尋”。NBP 和其他“兩耳不聞窗外事”的模型不一樣,它背後連著Google搜尋。這意味著它知道今天的股票行情,知道明天的天氣,甚至知道現在的熱點新聞。比如,我想去賞櫻花,但不知道那個時間點合適?提示詞:結合 Google 搜尋,根據當前的氣候預測和旅遊巨量資料趨勢,生成一張可視化資訊圖,展示2025年中國主要賞櫻勝地(如武漢大學、無錫黿頭渚)的最佳觀賞時間窗口。又比如,我想知道一下中國八大菜系的分佈。提示詞:結合Google搜尋,生成一張基於中國地圖的美食文化資訊圖,可視化展示‘中國八大菜系地理分佈’。請在地圖的相應區域清晰標註菜系流派(如在四川區域標‘川菜’、廣東區域標‘粵菜’),並為每個菜系類股附帶一個最具代表性的招牌菜手繪插圖。能隨時聯網查詢,真的是文生圖一個偉大的革新。04|“一句話修圖”,PS 可以解除安裝了這就屬於“甲方最愛”的功能了。“把背景裡的人去了。” “給這幅畫上個色。” “把白天改成晚上。”以前這些需求得改半天,現在就是一句話的事。移除路人提示詞:將這張照片背景中的所有遊客移除。使用符合故宮環境的古代青磚石板地面和紅牆建築基座紋理來邏輯地填充空缺區域,使整個廣場看起來完全空曠且真實。人物形象和姿勢保持不變給漫畫上色提示詞:給這幅漫畫上色場景本地化提示詞:把這個圖本土化為上海場景,包括將標語翻譯成中文。將背景改為夜晚繁忙的上海街頭。變化季節提示詞:將此場景轉變為冬季。保持房屋架構完全不變,但在屋頂和院子裡加入積雪,並將光照改為寒冷、陰沉的午後。05|2D 轉 3D,設計師狂喜這個功能簡直是降維打擊。把你畫的平面草圖扔進去,它能直接生成 3D 渲染圖;或者反過來,把 3D 模型變成平面結構圖。室內設計師、建築師,還有做表情包的朋友,這一塊必須玩起來。提示詞:基於上傳的2D平面戶型圖,生成一張單頁式的專業室內設計提案拼貼板。佈局上,頂部放置一張展示客餐廳區域的廣角透視主圖,重點呈現戶型圖中標誌性的圓形餐桌區和開放式廚房島台;底部並排展示三張小圖,分別為帶浴缸的主衛細節、書房視角以及該戶型的3D立體俯檢視。整體採用現代極簡風格,搭配溫暖的橡木地板和米白色牆面,確保所有圖像的光影自然柔和,達到照片級渲染畫質。提示詞:見附件將這張‘肌肉佩佩炒股’迷因圖轉化為一張逼真的3D渲染圖。保持構圖與原作完全一致,但將肌肉佩佩塑造成一個具有高度真實生物感、皮膚濕潤且肌肉紋理清晰的青蛙形象;同時,將筆記型電腦的螢幕渲染為真實的自發光液晶螢幕,並將桌上的四根蠟燭渲染為帶有真實蠟淚紋理和搖曳火焰的效果,在木桌上投射出溫暖、現實的光影。06|細節狂魔?請開高畫質模式如果你是做列印、出版,或者像我一樣是“數毛黨”,NBP 原生支援的 1K、2K 甚至 4K 輸出就很關鍵了。如果是用 Gemini 這類對話方塊,記得帶上 “高畫質”、“HD”、“4K” 這種關鍵詞,並且可以多描述一些材質細節,比如“皮革的紋理”、“金屬的劃痕”。提示詞:利用原生高保真輸出,打造一個令人驚嘆的、充滿氛圍感的雨中江南古剎屋簷特寫環境。指揮複雜的濕潤光影效果和細膩的陳舊材質紋理,確保每一滴雨水在老化木樑上的反光、以及瓦片縫隙中青苔的每一絲細節,都以適合4K壁紙的像素級完美解析度呈現。除了這種紋理的要求,還支援這種複雜的邏輯。提示詞:建立一張超現實的廣式雙黃月餅資訊圖表,將其切開或立體解構以展示金黃油潤的回油餅皮、細膩緻密的紅蓮蓉內餡以及中心質感沙軟且流著紅油的鹹蛋黃。請在圖表中詳細標註每一層獨特的口感層次和風味來源。07|它不僅會畫畫,還會做奧數題別忘了,NBP 結合了 Gemini 3 Pro 的大腦。它在畫圖前,是會“思考”的。 這意味著它可以處理邏輯問題。比如,讓它解一道複數域的數學題,還要寫出步驟:(來自官方案例)提示詞:在白板上求解 $log_{x^2+1}(x^4-1)=2$ 在複數域 C 中的解。清晰地展示步驟。或者,給它看一張精裝修的客廳,讓它反推出裝修前的“毛坯房”長什麼樣:提示詞:分析這張精裝修後的現代溫馨客廳照片,生成一張它在裝修前的‘毛坯房’狀態圖片。請展示裸露的水泥牆壁、地面上複雜的走線管道以及粗糙的混凝土質感,還原施工初期的真實場景。08|電影導演視角的“分鏡圖”想畫漫畫或者電影分鏡?不需要一張張生成。你可以要求它在一張圖裡畫出多個連續的情節。比如這個故事:一對身著新中式服飾的男女主角,演繹從都市喧囂回歸山林寧靜的高端茶品牌廣告電影級敘事畫面。提示詞:見附件構思一個引人入勝的9段式視覺故事,通過9張圖像呈現,主題是一對男女主角出演的一支獲獎級高端中國茶品牌文化廣告。故事線需要包含情感的起伏與轉折(例如:從都市的浮躁迷茫到回歸山林茶園的寧靜頓悟),並以一個女主角手持茶杯與品牌Logo同框的優雅定格鏡頭作為結局。請確保男女主角的面部特徵和服裝造型(如新中式風格服飾)在整個系列中保持嚴格一致,但需要通過豐富的攝影角度和景別變化(如航拍大景、中景互動、特寫細節)來展現。請務必逐一生成這九張圖像,並確保每張都採用16:9橫向畫幅。實際上,在 Gemini 裡面也支援一次生成多張圖片。09|像控制傀儡一樣控制構圖最後這個是大招。 除了用圖片控制人物長相,你還可以用圖片控制“結構”和“佈局”。你隨手畫個草圖(那怕很醜),或者給它一個指定的網格佈局,它就能乖乖把畫面填進去。提示詞:[上傳一張手繪圖]基於這個手繪線框圖結構,創作一個高保真的‘新中式國潮茶飲’手機UI介面設計。整體風格採用優雅的汝窯天青色與米色調,融入水墨紋理背景。頂部的‘標題列’顯示‘茶韻東方’Logo;中間三個‘主展示圖’分別放置茉莉花茶、烏龍奶茶和桂花酒釀飲品的高畫質攝影;‘藝術字宣傳標語’處是用書法寫的‘東方草本,純粹自然’;左下角‘正文內容區’是關於原料的介紹文字,右下角‘使用者評價欄’則顯示五星好評和短評‘茶香濃郁,回味甘甜!’。也可以根據草圖來製作廣告圖:提示詞:根據這個草圖製作一則廣告甚至可以讓它在一個指定的網格上畫圖。提示詞:[上傳網格圖]生成一個中國傳統舞龍龍頭的像素畫Sprite,使其完美對齊並填充進這個網格圖像中。請僅使用高飽和度的紅、黃、青色板,避免中間色調,以確保清晰度。💡 獨家心法:到底怎麼寫提示詞?看了這麼多案例,你可能發現了:NBP 根本不需要那些亂七八糟的“咒語”標籤。Google官方文件裡反覆強調了一個“黃金法則”:請像跟人說話一樣,跟 AI 說話。❌ 錯誤示範(堆砌標籤):“酷車,霓虹,城市,夜晚,8k,傑作,最佳畫質。” (這是在寫程式碼,不是在交流。)✅ 正確示範(自然語言):“充滿電影感的廣角鏡頭,拍攝一輛未來派跑車在夜晚雨後的上海街道上疾馳。霓虹燈的倒影映照在潮濕的路面和汽車金屬底盤上。”三個建議送給大家:別太模糊: “一個女人”是無效指令;“一個年輕的亞洲女性,眼神堅毅”才是有效指令。學會“微調”: 不要每次都重畫。如果一張圖 80% 滿意,就告訴它:“很好,把光線改成日落,其他別動。”給背景資訊: 它有腦子,告訴它“你是為一家書店做設計”,它會自己補全很多符合邏輯的細節。 (AI范兒)
Google深夜甩出一份【Nano Banana Pro提示詞指南】,手把手教你生產專業級內容,實戰案例+提示詞範本
Google“Nano Banana Pro”提示詞全解:把 AI 玩成 4K 級專業產線凌晨,Google生成式AI團隊毫無預警地甩出一份提示詞手冊——《The Complete Guide to Nano Banana Pro: 10 Tips for Professional Asset Production》。核心資訊只有一個:如何用Nano Banana Pro製作專業級內容~~~技術範式轉移:當AI開始“思考”創作Nano Banana Pro的進化核心在於意圖理解引擎的突破。與傳統模型的“關鍵詞匹配”機制不同,該系統具備:物理規則推演能力(如光影反射邏輯)構圖美學理解(黃金分割/視覺層次)語義上下文推理(品牌調性/受眾定位)以下是Google團隊的官方指南:Nano-Banana Pro 是相對於前代模型的重大飛躍,從“趣味性”圖像生成轉向“功能性”專業資產生產。它在文字渲染、角色一致性、視覺合成、世界知識(搜尋)和高解析度(4K)輸出方面表現出色。本文內容概覽:提示詞黃金法則文字渲染、資訊圖與視覺合成角色一致性與病毒式縮圖基於 Google 搜尋的資訊錨定高級編輯、修復與著色維度轉換 (2D ↔ 3D)高解析度與紋理思考與推理一次性故事板與概念藝術結構控制與佈局引導下一步是什麼?🛑 章節 0:提示詞黃金法則Nano-Banana Pro 是一個“會思考”的模型。它不僅僅是匹配關鍵詞;它能理解意圖、物理原理和構圖。要獲得最佳效果,請停止使用“標籤堆砌”(例如:狗、公園、4k、寫實),開始像創意總監一樣思考。1、編輯,而非重新生成 (Edit, Don't Re-roll)該模型在理解對話式編輯方面表現出色。如果一張圖像有 80% 是正確的,不要從頭開始生成新圖像。相反,只需要求進行你需要的具體更改。示例: “這很棒,但請將光線改為日落效果,並將文字改為霓虹藍色。”2、使用自然語言和完整句子 (Use Natural Language & Full Sentences)像向人類藝術家做簡報一樣與模型對話。使用正確的語法和描述性形容詞。❌ 差: “酷車,霓虹,城市,夜晚,8k。”✅ 好: “一張電影感的廣角鏡頭,展示一輛未來主義跑車在雨夜中飛馳穿過東京街道。霓虹燈招牌的燈光反射在濕漉漉的路面和跑車的金屬底盤上。”3、具體且具有描述性 (Be Specific and Descriptive)模糊的提示詞會產生通用的結果。定義主體、場景、光線和氛圍。主體:不要說“一個女人”,而要說“一位穿著復古香奈兒風格套裝的優雅老婦人”。材質:描述紋理。“啞光飾面”、“拉絲鋼”、“柔軟天鵝絨”、“皺紙”。4、提供上下文(“為什麼”或“為誰”)(Provide Context (The "Why" or "For whom"))因為模型會“思考”,給它提供上下文有助於它做出合乎邏輯的藝術決策。示例: “為巴西高端美食食譜創作一張三明治的圖像。”(模型將推斷出專業的擺盤、淺景深和完美的光線)。🛑 章節 1:文字渲染、資訊圖與視覺合成Nano-Banana Pro 擁有最先進(SOTA)的能力,可渲染清晰易讀、風格化的文字,並將複雜資訊合成為視覺格式。最佳實踐:壓縮 (Compression): 要求模型將密集文字或 PDF “壓縮”成視覺輔助工具。風格 (Style): 明確指定你想要的風格,如“精緻的編輯風”、“技術圖表”或“手繪白板”效果。引文 (Quotes): 明確指定你想要的文字,並用引號括起來。示例提示詞:財報資訊圖(資料輸入)[輸入 Google 最新財報的 PDF]“生成一張簡潔、現代的資訊圖,總結這份財報中的關鍵財務亮點。包括‘收入增長’和‘淨利潤’的圖表,並將 CEO 的關鍵引述高亮顯示在一個風格化的引文框中。”復古資訊圖 :“製作一張關於美國小餐館歷史的復古 1950 年代風格資訊圖。包含‘食物’、‘點唱機’和‘裝飾’等獨立版塊。確保所有文字清晰易讀,並採用符合該時期的風格化設計。”技術圖表:“建立一張正交藍圖,從平面圖、立面圖和剖面圖描述這座建築。用技術性建築字型清晰標註‘北立面’和‘主入口’。格式為 16:9。”白板總結(教育類):“將‘Transformer 神經網路架構’的概念總結為一張手繪白板圖,適用於大學講座。使用不同顏色的記號筆區分編碼器(Encoder)和解碼器(Decoder)模組,並為‘自注意力(Self-Attention)’和‘前饋網路(Feed Forward)’加入清晰標籤。”🛑 章節2:角色一致性與病毒式縮圖Nano-Banana Pro 最多支援 14 張參考圖像(其中 6 張具有高保真度)。這允許進行“身份鎖定 (Identity Locking)”——將特定人物或角色放入新場景中而不會出現面部扭曲。最佳實踐:身份鎖定: 明確說明:“保持人物的面部特徵與圖像 1 完全一致。”表情/動作: 描述情緒或姿勢的變化,同時保持身份不變。病毒式構圖 : 一次性將主體與醒目的圖形和文字結合起來。示例提示詞:“病毒式縮圖”(身份 + 文字 + 圖形)(The "Viral Thumbnail" (Identity + Text + Graphics)):“使用圖像 1 中的人物設計一個病毒式視訊縮圖。面部一致性:保持人物的面部特徵與圖像 1 完全一致,但將其表情改為興奮和驚訝。動作:將人物擺放在畫面左側,手指指向畫面右側。主體:在右側放置一張高品質的酪梨吐司美食圖片。圖形:加入一個醒目的黃色箭頭,連接人物的手指和吐司。文字:在中間疊加巨大的流行風格文字:‘3分鐘搞定!’。使用粗體白色描邊和投影效果。背景:模糊、明亮的廚房背景。高飽和度和對比度。”“毛絨夥伴”場景(群體一致性)[輸入 3 張不同毛絨玩偶的圖像]“創作一個由 10 個部分組成的搞笑故事,講述這 3 個毛絨朋友去熱帶度假的經歷。故事全程充滿刺激,有情感起伏,並以一個幸福的時刻結束。確保所有 3 個角色的服裝和身份保持一致,但他們的表情和角度應在所有 10 張圖像中有所變化。確保每張圖像中每個角色只出現一次。”品牌資產生成:[輸入 1 張產品圖像]“建立 9 張驚豔的時尚照片,彷彿出自獲獎時尚雜誌大片。使用此參考圖像作為品牌風格,但在系列中加入細微差別和變化,以傳達專業的設計感。請一次生成一張圖像,共生成九張。”🛑 章節3:基於 Google 搜尋的資訊錨定Nano-Banana Pro 利用 Google 搜尋,基於即時資料、時事或事實核查生成圖像,減少在時效性話題上的幻覺(hallucinations)。最佳實踐:要求可視化動態資料(天氣、股票、新聞)。模型在生成圖像前會“思考”(推理)搜尋結果。示例提示詞:事件可視化 (Event Visualization):“根據當前的旅行趨勢,生成一張關於 2025 年美國國家公園最佳遊覽時間的資訊圖。”🛑 章節3:高級編輯、修復與著色該模型擅長通過對話式提示進行複雜編輯。這包括“圖像修補 (In-painting)”(移除/加入對象)、“修復 (Restoration)”(修復老照片)、“著色 (Colorization)”(漫畫/黑白照片)和“風格轉換 (Style Swapping)”。最佳實踐:語義指令 : 你不需要手動繪製遮罩;只需自然地告訴模型要更改什麼。物理理解: 你可以要求進行複雜更改,例如“給這個杯子裝滿液體”來測試物理生成能力。示例提示詞:對象移除與圖像修補 (Object Removal & In-painting):“移除這張照片背景中的遊客,並用符合周圍環境的合理紋理(鵝卵石和店面)填充該空間。”漫畫/連環畫著色 (Manga/Comic Colorization):[輸入黑白漫畫分鏡]“為這張漫畫分鏡上色。使用充滿活力的動漫風格調色盤。確保能量光束上的光照效果呈現發光的霓虹藍色,角色的服裝與其官方配色保持一致。”本地化(文字翻譯 + 文化適配)[輸入倫敦公車站廣告圖像]“採用這個概念並將其本地化到東京場景,包括將標語翻譯成日語。將背景改為夜晚繁忙的澀谷街道。”光線/季節控制 (Lighting/Seasonal Control):[輸入夏季房屋圖像]“將此場景轉換為冬季。保持房屋結構完全相同,但在屋頂和院子裡加入積雪,並將光線改為寒冷、陰沉的下午光線。”🛑 章節4:維度轉換 (2D ↔ 3D:一項強大的新功能是將 2D 示意圖轉換為 3D 可視化效果,反之亦然。這非常適合室內設計師、建築師和表情包創作者。示例提示詞:2D 平面圖轉 3D 室內設計板 (2D Floor Plan to 3D Interior Design Board):“基於上傳的 2D 平面圖,在一張圖像中生成專業的室內設計演示板。佈局:拼貼形式,頂部一張大型主圖(客廳區域的廣角透檢視),下方三張小圖(主臥室、家庭辦公室和一個 3D 俯視平面圖)。風格:應用現代極簡主義風格,所有圖像均採用溫暖的橡木地板和灰白色牆壁。質量:照片級真實感渲染,柔和的自然光線。”2D 轉 3D 表情包轉換:“將‘This is Fine’狗表情包轉換為照片級真實感的 3D 渲染。保持構圖完全相同,但讓狗看起來像一個毛絨玩具,讓火看起來像真實的火焰。”🛑 章節5:高解析度與紋理Nano-Banana Pro 支援原生 1K 至 4K 圖像生成。這對於細節紋理或大幅面列印特別有用。最佳實踐:如果你的 API/介面允許,請明確要求高解析度(2K 或 4K)。描述高保真細節(瑕疵、表面紋理)。示例提示詞:4K 紋理生成:“利用原生高保真輸出,打造一個令人驚嘆的青苔森林地面的氛圍環境。掌控複雜的光照效果和細膩的紋理,確保每一縷苔蘚和每一束光線都以適合 4K 壁紙的像素級完美解析度呈現。”複雜邏輯(思考模式):“建立一張超寫實的資訊圖,展示一個解構的精緻芝士漢堡,展示烤布裡歐面包的紋理、肉餅的焦化外殼以及芝士閃亮的融化狀態。為每一層標註其風味特徵。”🛑 章節6:思考與推理Nano-Banana Pro 默認採用“思考”過程,在渲染最終輸出前會生成臨時的思考圖像(不收費),以最佳化構圖。這允許進行資料分析和解決視覺問題。示例提示詞:解方程 (Solve Equations):“在白板上解方程 log_{x^2+1}(x^4-1)=2 in C。清晰地展示步驟。”視覺推理:“分析這張房間的圖像,並生成一張‘之前’的圖像,展示該房間在施工期間可能的樣子,顯示框架和未完成的石膏板。”🛑 章節7:一次性故事板與概念藝術:你可以無需網格即可生成連續藝術或故事板,確保在單次會話中獲得連貫的敘事流。這也常用於“電影概念藝術”(例如,即將上映電影的虛假洩露圖)。示例提示詞:“創作一個引人入勝的 9 部分故事,包含 9 張圖像,講述一個獲獎奢華行李箱廣告中的一男一女。故事應有情感起伏,以一個展示女性和品牌標誌的優雅鏡頭結束。女性和男性的身份及其著裝必須貫穿始終保持一致,但可以且應該從不同的角度和距離展現他們。請一次生成一張圖像。確保每張圖像均為 16:9 的橫向格式。”🛑 章節9:結構控制與佈局引導輸入圖像不僅限於角色參考或待編輯的主體。你可以使用它們來嚴格控制最終輸出的構圖和佈局。這對於需要將草圖、線框圖或特定網格佈局轉化為精美資產的設計師來說是革命性的。最佳實踐:草稿與草圖: 上傳手繪草圖以精確定義文字和對象的位置。線框圖: 使用現有佈局或線框圖的截圖來生成高保真 UI 模型。網格: 使用網格圖像強制模型為基於圖塊的遊戲或 LED 螢幕生成資產。示例提示詞:草圖轉最終廣告 (Sketch to Final Ad):“根據這張草圖,為 [產品] 建立一個廣告。”線框圖轉 UI 模型 (UI Mockup from Wireframe):“根據這些指南,為 [產品] 建立一個模型。”像素藝術與 LED 螢幕 (Pixel Art & LED Displays):“生成一個獨角獸的像素藝術精靈,完美適配這張 64x64 網格圖像。使用高對比度顏色。”(提示:開發人員隨後可以程式設計提取每個儲存格的中心顏色,以驅動連接的 64x64 LED 矩陣螢幕)。精靈圖 (Sprites):“精靈圖:一個女人在無人機上做後空翻,3x3 網格,序列,逐幀動畫,正方形寬高比。嚴格按照所附參考圖像的結構。”(提示:你可以提取每個儲存格並製作 GIF 動畫)。(三次方AIRX)
矽谷大佬現身「豪華火雞局」,沒有一個是真人!
今年感恩節,AI比人先上桌!機艙火雞宴、政治名人拼盤、科技大佬假笑全刷屏得像真實記錄。節日本該是煙火氣和家人,卻被一堆不存在的合照搶走注意力。我們到底在看回憶,還是在被AI製造記憶?你可能也刷到過這張圖:Newman坐在中間,周圍是被P出來的一圈科技大佬,像在開公司年會。照片細節滿滿:火雞、紅酒、燭光一字排開,旁邊是笑得乖巧的祖克柏、馬斯克、納德拉、庫克……畫面精緻到像雜誌大片。這張圖被評為今年最「亂入」的感恩節名場面之一。Google剛上線的Nano Banana Pro,讓這張照片離「現場直擊」只差一個BBC水印。也許幾年後的感恩節,我們抬頭看著眼前的土豆泥,問「這是不是AI土豆泥?」今年的感恩節名場面,被AI承包了今年感恩節,最先上桌的不是人,是AI做出來的神圖。托AI的福,RFK Jr.把當年的麥當勞合照玩成感恩節版。薯條和漢堡被換成了孢子甘藍和蔓越莓,川普父子、馬斯克全員在桌邊「健康飲食」。離譜的是不止這一張。Newman親自下場,配文半開玩笑地說這是「AI牛市的感恩節晚宴」。Tiffany Fong更絕,直接把成龍請到自己餐桌旁幫忙切肉。這些「名人聚餐」,在社交平台上被轉得一本正經,像真的發生過一樣。這些照片的共同點,是「過分自然」。燈光剛好,皮膚剛好,連光都出現在應該出現的位置。這就是Google剛推出的Nano Banana Pro的威力。假圖,怎麼比真的還真?你有沒有發現,今年的感恩節合照像換了畫風?事實的確如此。感恩節前一周,Google才把Nano Banana Pro端上桌。媒體當時的評論一針見血:它不是在生成圖片,是在生成你會相信的場景。它最強的一點,是把那些最容易騙過人眼的細節全部「拉滿」:桌布的褶紋、玻璃杯的亮點、火雞表層的油光、燈光照在皮膚上的微妙柔焦……原本一眼假的地方,現在全都恰到好處。你已經不能再完全相信網上的照片了。Nano Banana與Nano Banana Pro對比更要命的是,它不用你懂技術,不需要專業攝影思路,不需要會修圖,只要一句提示,就能生成一堆感恩節場景。尤其是「名人+節日+食物」,這種最容易被接受、最不容易被懷疑的組合。這也是為什麼今年的AI合照的熱度比往年更高。過去的AI圖像靠「奇怪」,今年AI圖像靠「真實」。明知道是假的,為什麼還要轉發?今年感恩節有個特別有意思的現象:大家明明知道圖是假的,但還是忍不住點開、保存、轉發,甚至截圖發到群裡「看這個笑死我了」。它為什麼這麼好傳播?答案不是因為它逼真,而是它懂你想在節日裡看到什麼。今年的這些感恩節AI圖,本質上是「情緒出口·節日版」。節日期間,大家一邊忙著應付家人,一邊想找點輕鬆的東西喘口氣。而這些荒誕、無害、帶一點「節日限定混亂感」的AI圖像,剛好滿足了這種需求。比起真實的感恩節——廚房亂成一團、火雞切不動、親戚問東問西、孩子哭鬧,這些AI合照更像是節日的理想樣子:燈光正好、笑容統一、氣氛完美、連火雞都是高級擺盤。社交平台也特別偏愛這種內容。圖片本來就比文字更容易被推送,再加上這種「荒誕而不危險」的節日段子更容易讓人刷個不停,演算法自然把它往前排。Fast Company在談Nano Banana Pro時說過一句話:我們轉發的不是圖,而是一種想一起笑一笑的衝動。而這正是今年最微妙的點:這些AI圖火,是因為它們比真實的感恩節更輕鬆、更好笑,也更容易讓人覺得有參與感。但問題就出在這裡:當一張從沒發生過的合照被反覆刷到、反覆轉發,它開始在你的記憶裡佔位。你會下意識覺得「我見過」「好像看過新聞」「是不是某個場合拍的」。真實的節日畫面、記憶痕跡、現實關係通通被替代。這就是今年感恩節AI熱潮最讓人不安的一部分:你以為自己笑了一下,其實什麼都沒發生。刷了一圈今年的感恩節圖,你會發現一個挺好笑也挺現實的問題:螢幕裡的宴會永遠完美、永遠熱鬧、永遠上頭。而真正的感恩節,卻是混亂、乾巴巴火雞、吵鬧的孩子。AI做出來的那些照片當然好看,眾星雲集、燈光溫柔、火雞烤得剛剛好,一切宛如廣告片。可等你把手機放下,會突然意識到:能讓你伸手夾一口、能讓你覺得太鹹、能讓你笑出聲的,還是眼前這桌不完美的飯。也許今年最值得「感恩」的,不是先進的技術,而是一個簡單的提醒:好看的畫面可以生成,但真實的陪伴只能發生。把手機放一邊吧。螢幕裡的假名人,就讓他們繼續在AI裡吃飯。而你,只要存在,便是真實。 (新智元)
Nano Banana Pro 太火了,但生成的圖怎麼修改?
Nano Banana Pro 最近實在太火了,我看網友們都玩瘋了。我的評論區也炸了,其中一個問得比較多的問題是:生成的圖能修改嗎、怎麼修改?,所以這期就來聊聊到底怎麼改這些 AI 生成的圖。我向來有問必答,以解決網友痛點為己任,所以這期就來聊聊到底怎麼改這些 AI 生成的圖。01 在 Gemini 裡硬改?有點難大家應該知道,Gemini 裡面其實就有修圖,比如這張圖用 Gemini 生成後要修改:圖:Gemini 生成的圖現在想把 GUCCI 改成Nano Banana,我只需要直接說:把“GUCCI”換成“Nano Banana”,就可以了。圖:通過 Gemini 修改文字在一個連續的對話裡面,我們可以直接這樣操作,省去了下載再上傳的麻煩。但問題來了: Gemini 沒有“引用原圖”的功能。如果你聊嗨了,想修改好幾輪之前的圖,就還得乖乖下載再上傳。有點麻煩,但勉強能用。真正崩潰的是,這種方式只能做最最基本的操作。那怕需求稍微複雜一點點,它立刻就崩給你看。比如我想給她換雙指定的鞋子:圖:通過 Gemini 替換鞋子結果它給我輸出的是圖:Gemini 替換鞋子後海報翻車了鞋子是換了,但海報也毀了。其實目前的 AI 聊天式修圖大多如此。 雖然號稱“一句話修圖”,但本質上,這種方式不叫修圖,是重新生成一張圖。效果好不好?全靠“抽卡”運氣。02 終於找到了“手術刀”級的修圖難道沒有更好的方式嗎? 直到我試了下面這個操作:圖:在 Lovart 裡面精準修圖修改之後得到這張圖,效果可以用完美來形容。圖:Lovart 完美的完成了修圖這裡的操作可謂非常精準。注意看,我先選擇了要修改的部分,它自動識別並分離了元素。它精準地識別出了“鞋子”和“腳”,我直接勾選鞋子。然後選擇要替換的鞋子,這裡甚至能智能細化到“運動鞋”還是“鞋面”。圖:Lovart 裡面可以精細的選擇要編輯的對象也就是說,它本來只是要換個鞋子,結果這裡甚至能只換個鞋面!這麼牛逼且獨一無二的工具,必須再次安利給大家,那就是 Lovart。(https://lovart.ai)03 Touch Edit:這才是真正的生產力Nano Banana Pro 有多強,毋庸置疑。但如果加上一個同樣強的編輯工具,才能真正讓設計起飛,才叫真正能“幹活”。Lovart 這個 Touch Edit 實在是強大到離譜,而且操作巨方便。按住 ⌘ 鍵(Windows 用 ⌃),然後在任何需要修改的地方點選,它就能把那個地方標記好。圖:在 Lovart 中選擇編輯對象而且它會自動識別和分離那地方的元素,這樣我可以進行非常精細的修改。圖:在 Lovart 中選擇編輯對象更牛逼的是,我可以同時標記 N 個地方,然後一次把他們都改完。圖:在 Lovart 中一次編輯多個元素我只能說,這也太絕了!這理解能力簡直離譜!但你以為這就結束了?這才剛剛開始……這玩意不只讓我可以在單個圖裡面修,還可以跨圖編輯,這才是真正的降維打擊。圖:在 Lovart 中跨圖片編輯操作的結果是,得到一張這樣的圖:圖:跨圖片編輯的結果圖超級精準。人物形象完全沒變,墨鏡也完全移植過來了。 它的理解力,就跟人類設計師一樣,可以進行多種複雜的需求理解。比如下面這種操作,我覺得人類設計師都要思考一會兒,但它輕鬆搞定:圖:超複雜的跨多圖修改它就像人一樣把任務分解,做完第一步生成一張圖,然後做第二步,最終得到這樣的圖:圖:跨多圖修改的效果這個簡直無敵了。可以看到,這裡的編輯可以跨多個素材檔案,我可以分別使用每個素材的不同元素、構圖、色彩等等。如果沒有這樣的可視化操作介面,光在聊天框裡巴拉巴拉,根本無法完成。還有一個黑科技,之前也提過,就是可以把一張圖的各元素直接“炸開”,變成一個個的圖層,然後直接編輯它們!圖:Lovart 的元素分離並編輯分離後的元素另外告訴大家一件事:在 Lovart 裡面用 Nano Banana Pro 生成的圖都沒有水印!!04 總結有了 Lovart 這樣的工具,基本上可以做到隨心所欲的修圖。 而且,Lovart 上面幾乎整合了所有優秀的文生圖、文生視訊模型,一個訂閱就可以使用全家桶。並且我今天發現,他們居然因為黑五首次打折,會員最高 4 折。(好像到月底截止)我最近其實都是通過 Lovart 在使用 Nano Banana Pro,因為 Gemini 每天的額度根本不夠用。最良心的一點是:Nano Banana Pro 在這上面 365 天內不消耗積分。 🤣當然,Basic 及以上會員期間可以免積分使用 365 天的不只是 Nano Banana Pro,其他比如 Nano Banana / Seedream / Midjourney 這些頂尖模型也一樣。 (AI范兒)
Nano Banana Pro 太火,但Google最牛的 AI 產品是這個
最近這一波Google連番轟炸,為了趕稿我真的是黑白顛倒,導致嚴重缺覺。不過這事倒讓我對一個問題產生的巨大的好奇:人到底為什麼要睡覺?為了搞清楚這個問題,我去研究了一下,發現還真有本書叫《我們為什麼要睡覺》,一看居然有 354 頁。這就很糾結了,萬一這書不怎麼樣,豈不浪費我時間。這時候,還好有這個工具——NotebookLM。我把電子書丟進去,它很快生成了一個不到一分鐘的音訊摘要。圖:在NotebookLM 裡面生成音訊概覽它警告我說:睡眠不足會嚴重破壞免疫系統,患癌風險翻倍……睡眠絕不是簡單的“關機”。總之,睡眠是你為自己健康做的最有效的一件事兒。聽這段語音,就像一個朋友在親口給我介紹一樣,比看什麼豆瓣評論舒服多了。這確實引起了我閱讀的興趣,但 1 分鐘的介紹還是太短。所以,我又開啟了“深入探究”模式。圖:自訂音訊概覽好傢伙,它直接生成了 16 分鐘的播客(音訊),我開啟倍數,迅速聽完了。這簡直是打開了新世界的大門。播客是兩位主持人(一男一女)對話的方式,上來就給了一個駭人聽聞的案例:每晚只睡 5-6 小時的男性,某方面的“尺寸”會比睡 8 小時的人明顯小一圈……然後兩個人像講相聲一樣,詳細介紹了睡眠這回事為什麼重要。說實話,聽完我對這本書基本有了全面的瞭解。如果不做學術研究,到這裡我就算“讀”完這本書了。正好我家娃寫作業總是磨蹭,讓她早點睡她又不聽,我就想著把這本書推薦給她。但我知道,讓她看這種大部頭既不可能,也不合適。還好,NotebookLM 可以把書裡的內容改編成各種形式。為了讓娃喜歡,我讓它把關於兒童睡眠的章節,改成了一個“兒童故事書插圖”風格的視訊指令碼。內容極其生動,她肯定喜歡。我甚至都想好了,等她看完,我就要考考她。不過,出題都不用我出手,這裡自帶了“隨堂測試”功能,一鍵就能生成測驗題。圖:NotebookLM 中的測試看下來,這本書確實有趣。我決定在下次的讀書分享會上給大家做個分享。PPT,這裡也能一鍵生成。圖:NotebookLM 一鍵生成的 PPT最後,為了發個小紅書筆記或者朋友圈推薦這本書,我希望用一張圖來展示這本書的內容。好在,這裡可以直接生成資訊圖,而且可以用自己喜歡的任意風格。圖:NotebookLM 一鍵生成的資訊圖為了深入的研究這個問題,我又找了很多的網頁資料、Youtube 視訊,但不管如何檔案,我都可以直接塞進來。跟之前那些筆記軟體不一樣的是,資料再也不會在這裡積灰了。我隨時可以和這個資料庫對話。(想像一下,一個很長的視訊,即便開倍速也要看很久。在這裡可以直接問、直接總結了)圖:在 NotebookLM 中和資料庫對話這就是Google的 NotebookLM,能蒐集所有的素材,能和資料庫對話,能一鍵生成音視訊、PPT,能線上測驗。圖: NotebookLM 可以一鍵輸出的內容很多人說,它是Google最優秀的 AI 產品。它已經全面整合進了 Nano Banana Pro。最優秀的 AI 產品未必,但最好的 AI 學習軟體,我想是一定的。對了,到這裡使用:https://notebooklm.google.com/別讓那些好資料在我的最愛裡吃灰了。那怕只是為了聽那兩個 AI 講一段相聲,NotebookLM 也絕對值得你花 5 分鐘去試玩一下。 (AI范兒)
Nano Banana Pro 的知識解說圖,絕對是文生圖最屌的一次更新!
如果說過去,AI 作圖拼的是「藝術」和「想像力」;那麼今天,Nano Banana Pro(NBP)這波更新簡直是「降維打擊」——它帶來了文生圖領域最底層、也最實用的「知識解說圖」。在我看來,這絕對是這次更新最爆炸的亮點,甚至可以說是文生圖領域最屌的突破。畢竟,生成藝術品可能只是少數人的“玩具”,但化身“萬能知識可視化顧問”,幾乎每個人都無法拒絕的“剛需”。從複雜的硬體維修到優雅的領帶系法,從海報級科普到一秒看懂的醫學急救……NBP 正在用驚人的精度,終結那些令人頭禿的說明書和教科書。這,才是我們一直在等待的「生產力革命」。01. 精準度顛覆:它長了“透視眼”,專治各種看不懂🔍 結構分解:給萬物拍個“CT”口說無憑,直接上圖。我試著讓它畫了一張桌上型電腦的結構分解圖。提示詞:繪製一台桌上型電腦的結構分解圖又畫了一張有詳細中文零件標註的家用轎車外部結構分解圖。提示詞:一輛家用轎車繪製一張帶有詳細中文零件標註的外部結構分解圖效果真的驚到我了。這種把複雜硬體結構瞬間「透視」的能力,實在是一種牛逼的創舉。這意味著,「看懂結構」不再是專業維修師傅的特權。對於小白來說,以後想搞懂零件位置和功能,一鍵出圖就完事了。👔 動作解析:比影片更好用的“說明書”都說“一圖勝千言”,人類的本能就是更喜歡看圖,而不是讀長篇大論。就拿系領帶這事兒來說吧,說實話,我到現在都沒學會(尷尬,所以我平常幹脆直接用領結🙈)。以往想學的時候,得去找個幾分鐘的視訊,一邊暫停一邊手忙腳亂地比劃,體驗極差。提示詞:繪製系領帶的動作序列圖。但NBP 直接為我生成了一張系領帶的動作序列圖。同理,還有疊襯衫。所有的摺疊線、手勢動作,在一張圖裡被定格得清清楚楚。提示詞:繪製摺疊一件襯衫的所有摺疊線和動作序列圖。這裡有個細節特別恐怖(褒義):大家注意,我所有的提示詞,根本沒有告訴它第一步怎麼做、第二步怎麼穿。我只給AI 提了一個最終要求,是它自己呼叫了「大腦」裡的知識庫,把動作拆解好、把邏輯理順,最後才畫出來的。這,才是真正牛逼的地方。🍞 流程標準化:人人都是科普大神再舉個生活裡的例子。大家平常去小紅書搜怎麼做怎麼做、怎麼烤面包,最喜歡看的是什麼?肯定不是幾千字的廢話,而是一張清晰明了的流程圖,對吧?現在,你自己就能讓AI 幫你畫了!提示詞:建立一個展示如何製作面包的資訊圖表,中文,16:9。我輸入提示詞,幾秒鐘後,複雜的烘焙過程就被轉化成了簡潔、美觀的流程指南。就算是廚房小白,也能按圖索驥。這實用性,真的絕了。02. 邏輯碾壓:它不光有眼睛,還開始「長腦子」了Nano Banana Pro 不僅會畫“實物”,更恐怖的是它能理解並可視化抽象的、有邏輯關係的知識體系。這讓它成為了最強大的「AI 科普官」。📊 知識圖譜:一眼看懂複雜因果很多時候我們看科普文章,字都認識,連在一起就暈了。例如複雜的醫學原理。提示詞:繪製高血壓的五大主要誘因的層級與關聯關係圖我輸了提示詞後出來的結果讓我非常驚訝。它把複雜的因果關係轉化成了清晰的邏輯網。對於想做健康管理或科普的人來說,這就叫一眼鎖定核心矛盾,比看大段文字高效太多了。🚇 空間最佳化:路痴的終極福音這個功能我個人覺得最親民。NBP 居然能把抽象的「最短路徑」和「效率」在空間上畫出來!它解決的不僅僅是畫圖問題,而是我們的「導航焦慮」。提示詞:繪製搭乘地鐵時,從檢票口到列車車廂內最近出口的最短轉乘路徑圖。大家都有過在陌生城市搭地鐵找不著北的經驗吧?雖然目前可能還需要具體資料投喂,但這思路絕對是出行類應用的降維打擊。🎬 專業速成:把理論變成大片最後,我想學點攝影,但又不想啃枯燥的理論書。於是我讓它創造一張海報。 。提示詞:創造一張海報,以電影感、逼真的畫面解釋攝影中最常見的構圖法則(如三分法、引導線、對稱構圖)。結果它直接甩給我一張電影海報級的視覺教學。它把枯燥的「三分法」理論,完美融合在了逼真的畫面裡。那一刻我意識到,這就是學習的未來啊──把理論變成直覺。有了這種圖,學習效率翻倍都不止。03. 維度升級:急救、資料與腦洞的狂歡到了這一步,NBP 已經不滿足於解釋「是什麼」和「為什麼」了,它開始在資料、時間和風格上瘋狂「整活兒」。它能在一個畫面裡,把硬核知識玩出花來。🚑 關鍵時刻能救命(Life Saving)這是我認為全篇最有社會價值的場景:產生成人心肺復甦術(CPR)的按壓位置和動作分解圖。提示詞:產生對成人實施心肺復甦術(CPR)的按壓位置和動作分解圖。大家試想一下,在緊急關頭,誰有時間去讀幾百字的急救手冊?一張精準、無干擾、零失誤的示意圖,比任何文字都更有力量。NBP 產生的這張圖,去掉了所有多餘的藝術渲染,主打一個「保命」。光憑這一點,就值得給它點個贊。🍎 把枯燥資料變“好吃”做過PPT 的都知道,資料視覺化有多煩人。例如五種常見水果的糖含量和維C分佈,如果直接甩一張Excel 表格,觀眾一定會想睡覺。但NBP 把它變成了直覺的量化分佈圖,色彩鮮豔,對比鮮明。提示詞:繪製五種常見水果的含糖量和維生素C含量的量化分佈圖。這不僅僅是好看,而是輔助我們進行日常的健康和消費決策。📱 一張圖看盡十年想看iPhone 初代到現在的外觀演變?以前可能需要設計師摳圖摳半天,現在NBP 能在一張圖中透過時間軸完美呈現。提示詞:繪製iPhone 手機從第一代到現在的外觀迭代圖。這種把漫長的產品迭代史「濃縮」在一張圖裡的能力,用來做產品復盤或歷史科普,效果簡直炸裂。🎨 風格不再受限:當唐僧遇上Rick and Morty為了測試它的底線,我決定給它一個難題:“用Rick and Morty(瑞克和莫蒂)的風格,畫一張唐玄奘從長安前往西域取經的路線圖。”提示詞:產生一張圖片來說明唐玄奘從長安前往西域取經的路線,用Rick and Morty 的風格。結果?它真的做到了! 既保留了硬核的地理路線邏輯,又完美復刻了那股荒誕的動畫味兒,太有梗了!這證明了NBP 可以在保留知識嚴謹性的同時,自由切換為任何風格。還有那張可愛卡片通風的海洋深度分層科普海報,從陽光區到超深淵區,小朋友看了都移不開眼。提示詞:一張可愛卡通風格的海洋深度分層科普海報,展示從陽光區到超深淵區的五個主要區域。這就是教育內容生成器的終極形態──把知識變得有趣。🪐 趣味冷知識卡:太陽系的“瓜”說到有趣,科普最害怕的就是枯燥的資料堆砌。光列行星直徑、質量誰記得住?所以我靈機一動,給NBP 下了個指令。提示詞:畫一張太陽系的圖表,並為每顆行星標註一個有趣的事件,中文,16:9。這張圖出來我真的樂了。它沒有死板地去列參數,而是給每顆行星都挖了一個「瓜」。這那裡是一張普通的圖表,這簡直就是一張完美的趣味知識卡!用來給小朋友做天文啟蒙,或是拿來做科普影片的背景素材,簡直完美。🤯 終極王炸:我把一整本書丟給了它…如果說前面那些功能只是讓我覺得“好用”,那最後這個測試,真的讓我忍不住在螢幕前喊出了聲:“臥槽!”為了測試它的極限,我做了一件特別離譜的事:我試著把一整本書的核心內容「塞」給它,讓它把這幾百頁的精華,濃縮成一張圖畫出來。其實我當時沒抱太大希望,畢竟這牽涉到極強的閱讀理解、歸納總結和視覺重構能力。結果?它居然真的完成了。提示詞:將這本書的核心觀點整理成一張中文的資訊圖,風格要現代美觀,21:9它把書中原本晦澀複雜的理論框架,變成了一張邏輯清晰、重點突出的知識地圖。我盯著那張圖看了半天,腦子裡只有一句話:臥槽臥槽!牛逼!這那裡是畫圖,這是幫你把書給「讀薄」了啊!對於需要快速學習新知識的人來說,這簡直是核武等級的生產力工具。寫在最後:文生圖終於不只是「玩具」了測完這一圈,我最大的感觸是:Nano Banana Pro 的這個“知識解說圖”系列,標誌著文生圖領域終於從“生成藝術品”,正式邁向了“生成生產力”。以前我們用AI,是想看它能畫出多驚豔的畫,是圖一樂; 現在用NBP,是想讓它幫我們把複雜的世界“理解、拆解、並畫得明明白白”,是圖有用。無論你是急需一張救命的CPR 指南,還是想快速掌握一項新技能,亦或是僅僅想把枯燥的知識變得有趣,NBP 都給出了一個近乎完美的答案。是時候,徹底丟掉那些令人頭痛的文字說明書了。有話咱別說了,直接讓AI 畫出來吧! (AI范兒)
Nano Banana Pro 深夜炸場,但最大的亮點不是AI 生圖
奧特曼,迎來至暗時刻。Google 的AI 攻勢沒有半點減弱的跡象。如果說前幾天Gemini 3 Pro 的鐮刀伸向了「前端」領域,那麼今天則輪到了設計行業。剛剛發表的Nano Banana Pro(Gemini 3 Pro Image)再次在影像產生能力上重拳出擊。初級設計師的飯碗,怕是要端不穩了。核心功能如下:解析度支援:最高可輸出4K 解析度圖像多輪編輯:支援對話式、多輪次的圖像編輯工作流程多圖像合成:最多可將14 張輸入圖像組合為1 張輸出圖像搜尋增強:整合Google 搜尋能力,提供更精確、最新的知識支援不再「瞎猜」,Nano Banana Pro 終於學會了先思考再畫畫Nano Banana 的招牌能力是角色一致性強、對話編輯方式,而Nano Banana Pro 的核心進化在於它把Gemini 3 的深度思考能力完整接進了圖像生成流程。它產生一張圖之前,會先做一輪物理模擬和邏輯推演,而不只是憑視覺模式「胡猜」。提示詞:請繪製一張四宮格圖片,四張圖依次表現同一位戴著鬥笠的年輕男子分別發音“我”“上”“早”“八”,人物外貌保持一致,口型精準對應每個字的發音,整體風格統一,16:9,4K跨模態理解也在Nano Banana Pro 身上展現得更為徹底。憑藉Gemini 3 增強的多語言推理能力,你可以直接產生多種語言的文字,或一鍵在地化、翻譯你的內容。朋友丟來一頁漫畫,讓模型為漫畫上色並把氣泡裡的英文翻成中文。 Nano Banana Pro 上色乾淨,光影自然,文字辨識精準,英文排版也和氣泡形狀嚴絲合縫,整個過程從識別到翻譯再到重排一氣呵成,表現得就像在真正“理解”這張圖。提示詞:將圖片上的文字翻譯為中文,並上色,其他不變又或者,設計師過去需要反複調整的多語言漫畫、國際化海報以及宣傳物料,現在可以直接讓AI 一步到位。例如讓模型將英文海報中的英文翻譯成中文。這種從辨識、翻譯到設計的連貫處理方式,正是原生多模態架構最具威力的一面。而在文字生成能力上,經實測,Nano Banana Pro 儘管偶爾需要抽卡,但整體表現出色。提示詞:產生兩張豎版的微信群聊天介面截圖,群組成員正在討論Nano Banana Pro 的發布。不知道封面有沒有騙到你? 🤯無論是一句短標語還是一整段文字,都能清晰可讀,甚至支援多種紋理、字型與書法風格的精細排版。提示詞:仿古籍線描插圖風,關羽坐於油燈旁,身披寬袖戰袍,神態專注沉穩。桌案上擺著《春秋》竹簡、鎏金小刀、毛筆等器物,以纖細線條勾畫,保留古印刷風格。背景僅以幾筆勾勒牆角、屏風與兵器架,簡潔卻富古雅氣息。色彩以淺赭、灰墨、淡青為主,呈現古書插畫的文化韻味與歷史感,4:3。64k 的輸入Token 上限意味著它能理解極長的文字提示詞。無論是詳細的分鏡指令碼,還是複雜的多語言排版需求,都能很好理解。提示詞:生成一幅4K 古畫,畫上寫著:明月幾時有?把酒問青天。不知天上闕宮,今夕是何年。我欲乘風歸去,又恐瓊樓玉宇,高處不勝寒。起舞弄清影,何似在人間。轉朱閣,低綺戶,照無眠。不應有恨,何事長向別時圓?人有悲歡離合,月有陰晴圓缺,此事古難全。但願人長久,千里共嬋娟。針對前代解析度偏低的老問題,Nano Banana Pro 把畫質一步拉到4K,還允許自由設定更多長寬比。電影海報、寬螢幕牆紙、縱向分鏡,統統能直接生成。Nano Banana Pro 還支援最多14 張輸入影像的組合編輯,同時保持最多5 個角色的外觀一致。配合多輪對話能力,使用者可以不斷調整、整合多個素材,直到達到理想效果。不論是把草圖變成產品,還是將藍圖轉換成逼真的3D 建築,都能輕鬆實現概讀到成品的跨越。提示詞:哆啦A夢和李白在月下對酌。圓月高懸,古代亭台樓閣,哆啦A夢穿著唐朝服飾,李白持酒壺,石桌上擺著酒具,仙氣飄飄,中日混合畫風,精緻細節更進階的是專業級創意控制能力。你可以選擇、微調或變換影像中的任何部分,從調整鏡頭角度、改變風格到應用高級調色,甚至改變場景光線——把白天變成夜晚,或創造散景效果。這些過去需要在Photoshop 裡精細操作的工作,現在只需要一句話。搜尋+ 生成= ? Google 給出了終極答案如果說搜尋是Gemini 3 的「左腦」,那麼影像生成就是其「右腦」。這也是Nano Banana Pro(Gemini 3 Pro Image)架構中被低估但最具顛覆性的能力。傳統搜尋是使用者搜尋、搜尋引擎給連結、使用者點進網站、網站提供介面。而Nano Banana Pro 引入了搜尋增強功能(Grounding with Search)。當使用者要求產生一張可視化的圖片,展示在廣州旅遊的2 天行程」時,Nano Banana Pro 產生的圖片,包含了詳細的行程地圖、中英文註釋、以及景點圖片等。再例如Nano Banana Pro 能根據提示詞要求,從搜尋中獲取最新天氣狀況,再把溫度、風力、濕度、天氣趨勢等關鍵資料轉化為鮮明、富有設計感的視覺內容。提示詞:搜尋廣州即時天氣資訊,製作中文普普藝術風格的資訊圖,4:3這項能力之所以重要,是因為它讓創造過程具備了事實基礎、即時性和可驗證性。只能說,搜尋不愧是Google 的看家本領,無論是技術積攢的厚度,還是在理解上就已經領先一個身位。在產品定位上,Google 採用了雙模型策略:舊版Nano Banana 用於快速有趣的日常編輯,而Nano Banana Pro 則專注於復雜構圖與頂級畫質的專業需求。用戶可以根據場景自由選擇。對於消費者與學生,Nano Banana Pro 已在Gemini 應用中全球開放,只需選擇「生成圖像」並啟用「Thinking(思考)」模式即可使用。免費用戶會獲得有限額度,超出後將自動切回原版Nano Banana。而Google AI Plus、Pro 和Ultra 訂閱用戶則擁有更高額度。在美國地區,Google 搜尋的AI 模式中,Pro 與Ultra 用戶已經可以體驗Nano Banana Pro。 NotebookLM 中的Nano Banana Pro 也開放給全球訂閱用戶。值得注意的是,Google 在AI 透明度問題上採取了雙重策略。所有AI 產生的內容都會嵌入不可見的SynthID 數字浮水印,用戶現在可以在Gemini 應用中直接上傳圖像,詢問它是否由Google AI 產生。這項能力將很快擴展到音頻與視頻。既然Nano Banana Pro 已經強大到這個地步,那麼問題來了,普通人該如何最大化發揮它的能力?Google DeepMind 的產品經理Bea Alessio 給出了詳細的使用指南,其中透露出不少關鍵資訊。最基本的使用方式當然是隨便說一句話,讓模型自己猜你想要什麼。但如果你想達到專業水準,就需要像導演一樣思考。一個完整的提示詞應該包含六個要素:主體(誰或什麼)、構圖(如何取景)、動作(正在發生什麼)、場景(在那裡)、風格(什麼審美)、編輯指令(如何修改)。而如果你想要更精細的控制,還需要進一步明確:畫幅比例(9:16 豎版海報還是21:9 電影寬屏)、鏡頭參數(低角度、淺景深f/1.8)、光線細節(逆光的黃金時刻,拉長陰影)、調色方向(電影級調色,偏青綠色調)、以及具體的文字內容和樣式。附上官方部落格地址:https://blog.google/products/gemini/prompting-tips-nano-banana-pro/這種「攝影指導式」的提示詞寫法,正是Nano Banana Pro 和傳統圖像生成模型的分水嶺。因為它真的能理解這些專業術語,並把它們精準地轉化為視覺輸出。看到這裡,再回過頭看Google 這幾天連環發表的產品,就不難明白它想傳達什麼。無論是前幾天發布的Gemini 3 Pro 預覽版,還是今天亮相的Nano Banana Pro ,Google 試圖向世界證明:通往AGI(通用人工智慧)的道路,必須是多模態原生的。只有一個能看、能聽、能理解結構、能處理邏輯的模型,才可能對世界進行完整地「思考」。從技術層面來看,Nano Banana 系列模型讓影像生成正式進入了「先理解再表達」的階段。當AI 開始理解迷宮的路徑、物體的結構、文字的意義甚至UI 的互動邏輯時,它就不再只是一個畫圖工具,而是一個具有視覺思考能力的智能體。從商業層面來看,極低的推理成本和生成式UI 的出現,將徹底改變內容生產和資訊分發的邏輯。過去的互聯網由一個個固定網頁構成,而未來的互聯網更可能是一塊塊隨著你需求即時生長的介面。設計將不再只是人的手藝,介面也不再是由團隊層層打磨的成果。越來越多的視覺內容,會先交給AI,再由人補充或微調。Google 顯然已經提前看見了那個新世界,並且開始把入口推到所有人面前。 (APPSO)